Agent 时代已至:LLM 的下一步
周末看到两条新闻:
-
Anthropic 推出 Claude Opus 4.6 以及 Agent Teams 功能
-
OpenAI 发布 Frontier 平台,加速企业级 AI Agent 的部署
说实话,我并不意外。因为这一天,其实早就“一只脚踏出来了”。
先给自己脸上贴点金(笑):
我在之前的文章里就提到过这个疑问——
Agent 是不是一条弯路? 在反复读《Hello-Agents》之后,我反而开始怀疑,我们是不是在刻意回避一个更本质的问题:训练模型本身。
现在看,这些新闻更像是对那个判断的某种回应。
这只是第一步,而不是终局
目前,无论是 Anthropic 还是 OpenAI,本质上都还在做同一件事:
基于自有 LLM,构建深度耦合的 Agent 框架与工具链。
换句话说,是“用自己最懂的模型,去打磨最适合自己的 Agent 体系”。
从这个角度看,不管是 Manus、OpenClaw,还是其他第三方方案,又有谁能比大模型厂商自己更有说服力呢?
但这显然不是最后一步。
因为在我的设想里,他们现在提供的,仍然是Agent 框架本身:
-
要么是为自家模型深度优化的 Agent 架构
-
要么反过来,模型在训练阶段就已经针对这种架构做过 Agentic Reinforcement Learning
这两件事,本质上已经开始互相“咬合”。
题外话:DeepSeek 的一个细节,可能不是偶然
这里我想插一段题外话。
最近大家都在期待 DeepSeek 在春节期间发布 V4,也在猜它能 SOTA 多久。但我反而在想,它会不会走一条类似 Anthropic / OpenAI 的路径。
如果你去看 DeepSeek V3.1 / V3.2 的参数设置,会发现一个挺有意思的点:
-
上下文窗口长度在不断提升
-
但输出 max token 始终只有 8K
-
推理模式下虽然可以到 64K,但思维链本身会消耗大量 token
这意味着什么?
结合它的定价(输入 2 元 / MToken,输出 3 元 / MToken),你会发现:
它几乎没打算让你用它来做长文输出。
更合理的使用方式是:
-
组织一个很长、很复杂的上下文
-
用 8K 输出拿到结构化信息
-
再把结果喂回下一轮上下文
这本身就是一个典型的 Agent 设计思路。
所以我越来越觉得:这不是“限制”,而是某种有意为之的产品取向。 我考虑用另一篇文章来完整表达一下我这部分思考
回到问题:个人开发者该怎么做 Agent?
思路拉回来。
如果你是个人开发者,或者像我一样的非专业开发者 Agent 发烧友,那问题就来了:
我们到底该以什么原则,来构建“只为自己服务”的 Agent?
我先抛砖引玉,给自己总结了几条原则。
原则一:不要幻想“什么都能帮我做”
目标一定要单一,路径一定要清晰。
Agent 一旦变成“万能助理”,基本就等于失控。
原则二:不造轮子,只造连接器
必须承认一件事:
我既写不出高深的 Agent 调度算法,也设计不好复杂的记忆系统。
那就老老实实,把现成的 Agent 框架、记忆框架按自己的需求连接起来。
原则三:不追求“最优 Agent”,而是“最适合自己工作流的 Agent”
把 Agent 当成“自动化自己”的工具,
而不是“模拟一个聪明的人”。
原则四:模块化设计 + 显式状态管理
从小工具开始,一步一步扩展。
每完成一个模块,都应该是可测试、可验收、可回滚的。
那企业呢?谁会真正被 Agent 改变?
如果你是企业员工(我就是),那另一个问题就绕不开了:
大型企业 vs 中小企业,在 Agent 这件事上的最优策略,真的一样吗?
我的判断可能有点激进:
未来 3–5 年,真正被 Agent 深度改变的,很可能不是大型企业,而是中小企业。
原因并不复杂。
大公司有很多“必须谨慎”的包袱:
-
数据合规风险
-
供应商锁定风险
-
遗留系统集成风险
-
组织与流程变更成本
而中小企业恰恰相反:
-
决策链短
-
容错空间大
-
流程本就不完善(反而好改)
-
几乎没有沉没成本
所以我甚至在想:
中小企业会不会最先,真正让 Agent 变成“直接干活的虚拟员工”?
不是辅助,不是建议,而是:
-
真的发邮件
-
真的改表格
-
真的跑脚本
-
真的对接客户
对他们来说:
-
60 分:已经值回票价
-
80 分:就是物超所值
他们不追求永不出错,只追求:
比人便宜 + 比人快 + 错了能改。
但这也引出了最后一个问题
中小企业的劣势也很明显:
他们没有资源,也没有意愿去自研 Agent 框架。
这也许正是 Anthropic 和 OpenAI 的目标:
-
用 Claude Code / Codex
-
配合自家的 Agent 平台
-
帮中小企业“低成本上线 Agent 能力”
可问题是:
那些非 LLM 厂商,如果要入局 Agent,
在底层能力明显不占优势的情况下,
他们还能靠什么策略破局?
是做垂直场景?
做流程整合?
还是干脆放弃“通用 Agent”,只做行业 Agent?
这个问题,我也还在想。
你们怎么看?
加载中...